# pip install pytesseract -i https://mirrors.aliyun.com/pypi/simple/
# pip install Pillow -i https://mirrors.aliyun.com/pypi/simple/
# pip install pytesser3 -i https://mirrors.aliyun.com/pypi/simple/
from PIL import Image
import pytesseract

# 如果Tesseract没有自动添加到系统路径，你需要手动指定其路径
# 安装包在E:\电脑软件\系统&工具\文本识别tesseract-ocr-w64-setup-v5.3.0.20221214.exe
# pytesseract.pytesseract.tesseract_cmd = r'你的Tesseract安装路径'


def ocr_core(image_path):
    """
    这个函数接收一个图像文件路径，并返回该图像中提取的文本。
    """
    # 打开图像文件
    img = Image.open(image_path)

    # 使用Tesseract OCR来识别图像中的文字
    text = pytesseract.image_to_string(
        img, lang="chi_sim"
    )  # 'chi_sim'是简体中文的语言包,'eng'是英语的语言包

    return text


if __name__ == "__main__":
    image_file_path = "D:/项目/python/文字识别/test.png"  # 替换为你的图片路径
    result = ocr_core(image_file_path)
    print("识别出的文字如下：")
    print(result)
